• 検索結果がありません。

抄録 2016年度 卒業論文 | 筑波大学 情報学群 | 知識情報・図書館学類

N/A
N/A
Protected

Academic year: 2018

シェア "抄録 2016年度 卒業論文 | 筑波大学 情報学群 | 知識情報・図書館学類"

Copied!
1
0
0

読み込み中.... (全文を見る)

全文

(1)

マイクロブログにおける投稿パターンを考慮した

コミュニケーションスキルの分類手法の提案

石川 将吾

イベントや企画のために,ソーシャルメディアを利用できれば,多くの参加者を集められる.

その一方で,知らない人と繋がるためには,その人のコミュニケーションスキルを判定する必

要がある.

本研究では,マイクロブログへの投稿時間帯や他のユーザとのメンションに基づく交流を手

がかりにして,ユーザのコミュニケーションスキルを分類する手法を提案する.

提案手法では,ユーザの発信したツイートの内容を参照して作成した正解データを用いて,

特定の時間帯の投稿頻度や,ツイートの種類を投稿パターンとして抽出し,未知のユーザに対

して機械学習を用いたコミュニケーションスキルの分類を行う.また,相互情報量を用いて,

コミュニケーションスキルごとに特徴のある投稿時間帯を選択し,機械学習に使用する素性と

した.

投稿パターンを素性とした,ユーザのコミュニケーションスキルの分類の有効性を示すため

に,ベースラインとの比較実験を行った.実験では,コミュニケーションスキルの高いユーザ,

低いユーザ,どちらでもないユーザの3つの正解ラベルを付与した各147ユーザを対象とした.

提案手法は,相互情報量を用いて計算した特徴のある投稿パターンと,投稿時間帯についての

投稿数の平均と分散,Twitterの居住地を表す属性であるPlaceName またはプロフィール欄

への地名の表記の有無を素性とした.Random Forestを用いた実験の結果,提案手法では,F

値の平均が全体で0.47,正解率が0.44となり,コミュニケーションスキルの高いユーザについ

ては,F値が0.52となった.また,ベースラインとして,ユーザに対して各ラベルを,ランダ

ム付与した結果,F値の平均が全体で0.30,正解率が0.30になった.さらに,投稿時間帯に

ついての投稿数の平均と分散を素性として使わない場合,F値の平均が全体で0.37,正解率が

0.36と低下した.結果について調査したところ,コミュニケーションスキルの低いユーザの投

稿時間帯についての投稿数の分散が他のユーザよりも大きくなり,特にリツイートにおける差

が顕著であった.このことから,コミュニケーションスキルの低いユーザは,ツイートの投稿

時間帯にばらつきがあると分かる.

以上の実験を通し,投稿パターンを用いたコミュニケーションスキルの分類の有効性が確認

できた.また,投稿時間帯についての投稿数の分散が,コミュニケーションスキルの分類に有

効なことを明らかにした.一方で,コミュニケーションスキルの低いユーザには,ツイートに

人を中傷する言葉や,性的と捉えられる言葉が特徴語として現れるため,素性として利用する

ことが考えられる.

今後の予定としては,コミュニケーションスキルごとの特徴語を素性として追加して,正解

率を高めることを検討している.

参照

関連したドキュメント

諸君はこのような時代に大学に入学されました。4年間を本

を軌道にのせることができた。最後の2年間 では,本学が他大学に比して遅々としていた

睡眠を十分とらないと身体にこたえる 社会的な人とのつき合いは大切にしている

がん化学療法に十分な知識・経験を持つ医師のもとで、本剤の投与が適切と判断さ

平均車齢(軽自動車を除く)とは、令和3年3月末現在において、わが国でナン バープレートを付けている自動車が初度登録 (注1)

平均的な消費者像の概念について、 欧州裁判所 ( EuGH ) は、 「平均的に情報を得た、 注意力と理解力を有する平均的な消費者 ( durchschnittlich informierter,

キャンパスの軸線とな るよう設計した。時計台 は永きにわたり図書館 として使 用され、学 生 の勉学の場となってい たが、9 7 年の新 大

「PTA聖書を学ぶ会」の通常例会の出席者数の平均は 2011 年度は 43 名だったのに対して、2012 年度は 61 名となり約 1.5